ンジ ヌメ テ ム LSI 上 に パケット ド 軸 】 


っ 。| ウツ トワ ニーク ・ シ ステ ム を 捕 


ーー 非同期 オシ チッ プ ・ ネ ットワーク の 設 語 


CHAIN オン チッ プ ・ ネ ットワーク は , 階層 型 バス 接続 より 優 
れ て いる ネッ トワ ー ク 接続 の 利点 と , セル フタ イム ド 手 法 に よ 
る 設計 (いわ ゆる 非同期 設計 方 式 ) が 備え る タイ ミン グ 収 束 や 
低 消費 電力 の 利点 を 合わ せ 持 つ 手法 で ある . この 手法 を 導入 す 
る と , 最新 の プロ セス で 製造 され た LSI が 抱え る いく つか の 配 
線 関連 の 問題 , すなわち 複雑 な 配線 構造 や 消費 電力 管理 , 
イミ ング 収束 な どの 問題 を 柔軟 に , そし て クロ ッ ク に 依存 し な 
い 形 で 解消 する こと が で きる . ここ で は 小 規 模 な 試作 チッ プ を 
例 に , CHAIN アー キテ クチ ャ の 呈 本 的 な 考え か た を 解説 する . 
また , セル フタ イム ド 手 法 に よる オン チッ プ ・ ネ ットワーク の 
設計 を 支援 する ツー ル や ライ ブラ リ も 紹介 する . (筆者 ) 


シス テム が 複雑 に な り , また , CMOS LSI の 集積 度 が 上 
が っ た 結果 , 素子 遅 引 ゲー ト 遅延 ) より も 配線 遅延 の 影 
響 の ほう が 大 きく な っ て き て いま す . これ に 伴っ て , シス 
テム LSI に 集積 する 回 路 ブ ロッ ク ( ユ コンポーネント ) の 間 を 
適切 に 接続 する こと が だ ん だ ん 難し く な っ て き て いま す . 

現在 , LSI 設計 者 は , 場当たり 的 に 階層 化 さ れ た クロ ッ 
ク 同期 の バス や , それ ら の 間 を つなぐ ブリ ッ ジ を 利用 し て 
いま ず 図 1). バス ・ ク ロッ ク 周 波数 は , その バス に つ な 
が る 周辺 回 路 デバ イス ) の 通信 要求 伝送 性 能 な ど ) に 基 
づい て 決定 され ます . た だ し , 実際 に 得 ら れる バス の 動作 
速度 は , 物理 的 な バス 配線 の 長 さ や , レイ アウ ト の 最適 化 
に どれ だ け 多 く の 時 間 を か けら れ た か に 左右 され ます . 

階層 型 バス 接続 を ベー ス と する LSI は , 徐々 に 設計 する 
こと が 困難 に な っ て き て いま す . 電話 シス テム が 回 線 交換 
か ら パ ケッ ト 交換 へ と 移行 し た よう に , 回 路 ブ ロッ ク 間 の 
接続 は 現行 の 階層 型 バ ス 接 続か ら , この 難題 を 解消 で きる 
ネッ トワ ー ク 技術 を 使っ た 接続 へ と 移行 する こと で し ょ う . 
本 稿 で は , セル フタ イム ド 手法 を 使っ て オン チッ プ ・ ネ ッ 


トワ ー ク を 実装 する こと に より , 設計 を 複雑 に し て いる タ 
イミ ング 収束 や 消費 電力 管理 の 課題 を 解決 で きる こと を 説 
明 し ます . 

セル フタ イム ド 手法 の オン チッ プ ・ ネ ットワーク ( 例え ば 
筆者 ら が 提供 する CHAIN オ ンチ ッ プ ・ ネ ットワーク ) を 中 
核 と し て シス テム LSI を 構築 する と , それ ぞ れ 異な る 周波 数 
で 動作 する IP コア どう し を ( それ が 同期 設計 に よる も の で 
あっ て も , セル フタ イム ド 手法 で 設計 され た も の で あっ て 
も ) その まま 接続 で きま す . その 結果 , ITRS International 
Technology Roadmap for Semiconductors) の ロー ド マッ 


マイ クロ 園 
孝 め 9 PA 
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IEEE 凶 
1394 


IP コア 


IP コア 凶 


ブリ ッ ジ 凶 


56kbps の IEEE 凶 
UART 802.11 
PCM: pulse code modulation 図 


UART: universal asynchronous receiver-trans mitter 


図 1 階層 型 バ ス 接続 の 例 


現在 の LSI 設 計 で は , 階層 化 さ れ た クロ ッ ク 同期 の バス や それ ら の 間 を つなぐ 
ブリ ッ ジ が 利用 され て いる . 
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プ に 示さ れ て いる よう な GALS globally-asynchronous 
locally-synchronous: 大 域 的 に 見 る と 非同期 , 局所 的 に 見 
る と 同期 ) 構成 の LSI が 得 ら れ ま す . 


@ バス の 代わ り に リン ク と スイ ッ チ で 通信 網 を 構成 

CHAIN 技 稚 ? は , シス テム LSI 上 の 回 路 ブ ロッ ク の 間 
を 接続 する 一 つの 手法 で す . この 手法 で は , 低 コ スト の つ 
まり , チッ プ 面 積 に ほとん ど 影 響 を 与え な い ) スイ ッ チ と 
狭 帯 域 の リリ ンク ( チャ ネル ) に よっ て 構成 され る ネッ トワ ー 
ク を 利用 し ます . この ネッ トワ ー ク は , 信号 遅延 の 影響 を 
受け な い セ ルフ タイ ム ド 手法 の 通信 プロ ト ユル に 従っ て 動 
作 し ます . 

伝送 性 能 を 引き 上 げ る た め , リン ク や スイ ッ チ を 2 
重 に 束ね て 使用 する こと も で きま す . また , クラ イア ント 
と な る デバ イス ( 回 路 ブ ロッ ク ) と の 間 に 仮 想 的 な が コネ クシ 
ョ ン を 実現 する た め , 厳密 に 定義 され た パケ ッ ト ・ フ ォ ー 
マッ ト と 組み 合わ せ て 利用 する こと も 可能 で す . 

2 に CHAIN 技 術 に よる リン ク の 例 を 示し ます . 一 つ 
の リン ク は 五 つ の 送信 信号 と 一 つの アク ノリ ッ ジ 信号 か ら 
成 さ れ ま す . これ ら の 信号 を 使っ て セル フタ イム ド 方 式 
の フロ ー 制 御 を 実現 し ます . また , この リン ク は , デー タ 
符号 化 方 式 と し て ワン ホッ ト ・ エ ンコ ー デ ィング を 利用 し 
て , 2 ビッ ト の デー タ や 制御 マー カ , eod end of packet) 
マー カ を 送信 し ます . デー タ を 送っ た 後 , RTZ return to 
zero) プロ トコ ル に 従っ て アイ ド ルル 状態 に 戻り ます . その 
た め , 2 ビッ ト の 伝送 に 対し て 全部 で 4 デー タ 信 号 に つ 
いて 2 回 , アク ノリ ッ ジ 信号 に つい て 2 回 ) の 信号 変化 が 発 
生 し まず いわ ゆる 4 相 ハ ンド シェ ー キ ング ). 


Im 
て う 


記 k 


⑯ リピ ー タ が パイ プラ イン ・ ラ ッ チ に 置き 換わる 
最 先端 の CMOS プ ロ セ ス を 利用 し て 製造 され た LSI で 


Sender Receiver 


図 2 CHAIN リ ンク 


ー つ の リン ク は 五 つ の 送信 信 富 eop, d0, 
d1, d2, d3) と 一 つの アク ノリ ッ ジ 信太 ack) 
か ら 構 成 さ れ て いる . 
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は , 長い 配線 に お いて 重大 な 信号 遅延 が 生じ まず 信号 の 
伝播 遅延 時 間 は 配線 長 に 比例 する た め ). これ は , 信号 波 
形 を 元 に 戻す た め に , 複数 の リピ ー タ の 挿入 が 必要 に な る 
こと を 意味 し ます . 

CHAIN オ ンチ ッ プ ・ ネ ットワーク で は , これ ら の リピ 
ー タ が パイ プラ イン ・ ラ ッ チ に 置き 換わり ます . これ に よ 
っ て , リン ク の サイ クル ・ レ ー ト ( 動作 周波 数 ) は 上 が り 
ます が , レイ テン シ が 増え る こと は ほとん ど あ り ま せん . 
この 種 の 置き 換え で は , レイ テン シ に ほとん ど と 影響 を 与え 
る こと な く パ イプ ライ ン の 深 さ を 変更 で きま す . これ が セ 
ルフ タイ ム ド 手法 の 利点 の 一 つ に な っ て いま す これ に 対 
し て 同期 設計 方 式 で は , パイ プラ イン の 段数 を 増やす と , 
か な ら ず レイ テン シ が 増加 する ). 
結果 と し て , ファ ブリ ッ グ チッ プ 全 体 ) の 性 能 を 制限 し 
て いる グロ ー バ ル ・ ク ロッ ク の 問題 が な が く な り , ネッ トワ 
ー ク の 中 の リン ク を 個別 に 調整 最適 化 ) で きる よう に な り 
ます . 図 3 に CHAIN パ イプ ライ ン ・ ラ ッ チ の 回 路 例 を 示 
し ます . この 回 路 の 中 の キー と な る 部 分 は , デー タパス ・ 
ラッ チ ヂ ( 実際 に は , トラ ンス ペア レン ト ・ ラ ッ チ に 似 た 
Muller C エ レ メ ン ド ⑨) と OR ゲー ト で す . OR ゲート は 有 
効 な ラッ チ 出 力 を 検出 し , アク ノリ ッ ジ 信号 を 生成 し ます . 

CHAIN リ ンク の リン ク 長 配線 長 ) に 対す る サイ クル ・ 
レー ト の 変動 に 関し て シミ ュ レ ーション し た 結果 を 図 4 
に 示し ます . モデ ル と し て は , 台湾 TSMC Taiwan Semi- 
conductor Manufacturing Co.) が 提供 し て いる 180nm 
CMOS プロセス ( 配線 は A1) の SPICE モ デル ( ARC モデ ル ) 
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図 3 CHAIN パ イプ ライ ン ・ ラ ッ チ 
この 回 路 の 中 の キー と な る 部 分 は , デー タパス ・ ラ ッ チ と OR ゲー ト . OR ゲー ト は 有効 
な ラッ チ 出 力 を 検出 し , アク ノリ ッ ジ 信号 を 生成 する . 
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図 4 
CHAIN リ ンク の サイ クル ・ レ ー ト と リン 4 
ク 長 9 
リン ク 長 が 2mm の 場合 , サイ クル ・ レ ー ト は 最大 
380MHz, 伝送 性 能 よ さ 1 リ ンク 当たり 約 0.75 0 」 
Gbps. さら に 高い 伝送 性 能 が 必要 な 場合 は , 複 0 0.1 


数 の リン ク を 東 ね て 使用 する こと も で きる . 


を 使用 し まし た . リン ク 長 が 2mm の 場合 , サイ クル ・ レ 
ー ト は 最大 380MHz, 伝送 性 能 スル ー プ ッ ト ) は 1 リン ク 
当たり 約 075Gbps で ある こと が わか り ま す . さら に 高い 伝 
送 性 能 が 必要 な 場合 に は , デー タパス ( 伝送 路 ) の バン ド 
幅 を 広げ る た め に , 複数 の リン ク を 東 ね て 使用 し ます . 

な お , ここ で 使用 し た リピ ー タ は , 駆動 力 が x2 の 標準 
セル で す . 駆動 力 の 高い セル を 使用 すれ ば , 上 記 の サイ ク 
ル ・ レ ー ト は 500MHz まで 上 が り ま す . 


⑯ デー タ 転 送 に パケ ッ ト 交 換 方 式 を 導入 可能 

図 3 の パイ プラ イツ タッ 家 リピータ) を 大 張 し で る 
スイ ッ チ ・ ネ ットワーク の 基本 モジ ュー ル を 構成 する こと 

可能 で す . CHAIN オ ンチ ッ プ ・ ネ ットワーク は , 分 散 
型 ス イッ チン グ ・ フ ァ ブ リッ ク の 考え か た を 採用 し て いま 
す . デー タ は ネッ ト ワー ク ・ ゲ ー ト ウェ イ の 間 で パケ ッ ト 
の 形 で 受け 渡さ れ ま す . パケ ッ ト の 先頭 に は 経路 情報 が 納 
め ら れ て お り , パケ ッ ト は これ に 基づい て 受信 側 の ゲー ト 
ウェ イ に 転送 され ます . 一 方 , パケ ッ ト の 末尾 に は eop マ 
ー カ が 存在 し ます . eop マ ー カ に よっ て パケ ッ ト が 通過 し 
た こと を 検出 する と , 即座 に その 経路 は クリ アダ ウン ( 消 
去 ) さ れ ま す . 

後述 する 試作 チッ ゴ Buxton ?」 の オン チッ プ ・ ネッ ト 
ワー ク で は , 以下 の よう な パケ ッ ト ・ フ ォ ー マ ッ ト を 採用 
し まし た . 
e パケ ッ ト の 先頭 は 経路 シン ボル 
e 8 ビッ ト の パケ ッ ト ・ ヘ ッ ダ に は , トラ ン ザ クシ ョ ン の 


0.2 0.3 04 0.5 0.6 
サイ クル ・ レ ー ト ( GHz) 較 


シー ケン ス ・ タ グ と イニ シ エ ー タ 識別 子 が 含ま れる 

e 8 ビッ ト の バス ・ メ ッ セ ー ジ ・ ヘ ッ ダ で バス 制御 信号 を 
伝送 する . また , ペイ ロー ド で 伝送 され る バス 転送 デー 
タ の タイ プ が 示さ れる 

e ペイ ロー ド は 16 ビッ ト 単位 に 分 割 さ れ て いる 

e パケ ッ ト の 最後 は eop マー カ 

この オン チッ プ ・ ネ ットワーク 内 の 接続 に お いて , 複数 
の リン ク を 東 ね て 使用 する 場合 , 経路 シン ボル と eop シ ン 
ボル に つい て は 全 リ ンク で コピ ー さ れ , パケ ッ ト 本 依 メ 
ッ セ ー ジ ) に つい て は 各 リ ンク に 振り 分 け て 送信 され ます . 
試作 チッ プ で 採用 し た この 方 式 は , あく まで も リン ク を 東 
ね て 使用 する 方 法 の 一 例 で あり , この ほか に も いく つか の 
方 式 が 考え られ ます . 例え ば , 経路 シン ボル も 各 リ ンク に 
振り 分 ける 方 法 や , 特定 の リン ク を 使っ て 経路 情報 や eop 
情報 を 転送 し , これ 以外 の リン ク と の 間 に マ スタ ・ ス レー 
ブ の 関係 を 作る よう な 方 法 で す . 


⑱ ゲー トウ ェ イ と イン ター フェ ー ス ・ ア ダ プ タ を 用 意 
ネッ トワ ー ク ・ フ ァ ブ リッ ク の 先 に は ネッ トワ ー ク ・ ゲ 

ー ト ウェ イ が あり , これ は スイ ツチ ・ ネ ットワーク 全体 の 

メッ セー ジ 交 換 に 必要 な さま ざま な 制御 , お よび デー タ の 

分 解 ・ 組み 立て を 実行 し ます . 例え ば , 以下 の よう な 機能 

PNG 

e パラ レル ・ デ ー タ を 狭 帯 域 の コネ クシ ョ ン を 使っ て 伝送 
する た め の シ リア ライ ザ / デ シリ アラ イザ 

e 送信 側 か ら 受信 側 ヘ パケット を 導く た め に 必要 と な る 経 
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路 シ ン ボ ル の 決定 と , パケ ッ ト の 先頭 へ の 挿入 ( 送信 ) 
e パケ ッ ト と ペイ ロー ド の タイ プ を 示す メッ セー ジ ・ ヘッ 

ダ の 組み 立て 

メッ セー ジ の 未 尾 に 位置 し , ネッ トワ ー ク 上 の パケ ッ ト 

転送 経路 を クリ アダ ウン する eop: シン ボル の 送信 

e ネ ットワーク ・ フ ァ ブ アリ ッ ク の 財 較 や ゲー ト ウェ イ 

バッ ファ の 混雑 を 最小 限 に 抑 える た め の フ ロー 制御 

ゲー ト ウェ イ は , 通常 , ネッ トワ ー ク に 対し て 二 つ の ポ 
eSGU ー つ は パケ ッ ト の 送信 用 で , も う 一 
つ は 受信 用 で す . ネッ トワ ー ク ・ フ ァ プ ブリック の ト ポロ ジ 
( 接続 構造 ) に従って, こう し た ゲー ト ウェ イ は , リン ク で 
つなが れ た クラ イア ント と な る IP コ の 含む TP サ 
ブシ ステ ム に 対し て , イニ シ エ ー タ ( デー タ 転送 を 要求 す 
る 側 ) に な っ た り , ター ゲッ ト ( デー タ を 提供 する 側 ) に な 
っ た り , ある い は 両方 の 役目 を 果たし た り し ます . 試作 チ 
ッ プ で 採用 され た イニ シ エ ー タ ・ ゲ ー ト ウェ イ の 内 部 構成 
を 図 5 に 示し ます . 

筆者 ら ( 英国 Silistix 社 ) が 開発 し た ネッ トワ ー ク ・ ゲ ー 
トウ ェ イ は , セル フタ イム ド 手法 の プロ ト ユル ( CGP : 
CHAIN Gateway Protocol) に 対応 し た 独自 の ソケット ・ 
フォ ー マ ッ ト を 採用 し て 通信 し て いま す . また , 今日 の 業 
界 標準 バス ( AMBA りや OCP, CoreConnecf ②) に 対応 
し た 上 既設 計 の IP コア を 再 利用 で きる よう に , CGP ソ ケッ 
ト と 従来 の プロ ト コル の 間 の マッ ピン グ を 行う クラ イア ン 
ト *・ アダ ブタ の ライ ブラ リ を 開発 し まし た . この アダ プ タ 


迷 


パケ ッ ト ・ ヘ ッ ダ 
組み 立て 較 


[ 電 還 レス ポン ス 図 


図 5 イニ シ エ ー タ ・ ゲ ー ト ウェ イ 

ゲー ト ウェ イ は , リン ク で つなが れ た クラ イア ント と な る IP コア や バス を 
含む |P サ ブシ ステ ム に 対し て , イニ シ エ ー タ ( デー タ 転送 を 要求 する 側 ) に 
な っ た り , ター ゲッ ト ( デー タ を 提供 する 側 ) に な っ た りす る . ここ で は イ 
ニシ エー タ の 構造 を 示し て いる . 
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受信 


* ゃ We 


は , バス の 概念 を ネットワーク の 機能 に マッ ピン グ し ます . 
加え て , バス ・ ト ラン ザク ショ ン の 転送 要求 処理 や , セル 
フタ イム ド な CGP ソ ケッ ト と 同期 設計 方 式 の IP コア ( 従来 
の バス ・ プ ロト ユル ) の 間 の 変換 処理 も 行い ます . 


@ 大 学 が スマ ー ト ・ カ ー ド 用 LSI を 試作 

本 稿 で 紹介 する オン チッ プ ・ ネ ットワーク 技術 の 多く は 
英国 University of Manchester が 開発 し た スマ ー ト ・ カー 
ド 用 の 試作 チッ ズ に 実装 され て いま す . この チッ プ は 
TSMC の 180nm の CMOS プロ セス で 製造 され まし た . 

この TLSI の オン チッ プ ・ ネッ ト ワー ク は , 且つ の イニ シ 
エー タ ・ ゲ ー ト ウェ イ , 六 つ の ター ゲッ ト ・ ゲー ト ウェ イ , 
そし て 外部 か ら オ ンチ ッ プ ・ ネ ットワーク に 直接 アク セス 
で きる ネッ トワ ー ク ・ デ バッ グ ・ ポ ー ト を 搭載 し て いま す . 
また , この ネッ トワ ー ク NM か ら 
な り , 第 1 の セグ メン ト で は イニ シ エ ー タ か ら タ ー ゲ ッ ト 
へ コマ ンド を 送信 し , 第 2 の セグ メン ト で は イニ シ エ ー タ 
へ 応答 を 返し ます . 

本 試作 チッ プ は , イニ シ エ ー タ と し て 2 個 の ( セル フタ 
イム ド 手法 で 設計 し た ) マイ クロ プロ セッ サ と テス ト ・ イ 
ンタ ー フ ェ ー ス を , ター ゲッ ト と し て 各種 メモ リ と UART 
お よび 
実験 用 ユニ ッ ト を 備え て いま す . プロ セッ サ に つい て は , 
CGP ソ ケッ ト と 接続 する た め に , あら た め て イン ター フェ 


( universal asynchronous receiver transmnitter ) , 


ー ス に 手 を 加え る 必要 は ほとん ど あ り ま せん で し た. 一 方 , 
これ 以外 の デバ イス に つい て は , 小 規模 アダプタ ・ ラッ 
パ 回 路 を 付加 する 必要 が あり まし た . 


@ 4 個 の リン ク と スイ ッ チ 部 品 を 組み 込む 
スマ ー ト ・ カ ー ド に 必要 な 処理 性 能 は た か だ か 10MIPS 

程度 な の で , この チッ プ に 複雑 な 高 性 能 ネ ットワーク は 不 

要 な の で す が , ここ で は CHAIN が 備え る 以下 の 三 つ の 拡 

中 性 を 利用 し まし た . 

e リ ンク 長 一 - 性 能 要求 が 高く な か っ た た め , 1 リン ク 当 
た り 約 075Gbps の 伝送 性 能 が 得 られ る 約 2mm の リン ク 
を 使用 し た . 

e 束ね た リン ク の 数 一 二 つ の リン ク を 利用 し て , 合計 1.5 
Gbps の 伝送 性 能 を 得 た . これ が , 約 3100 万 メッ セー ジ 
/s の メッ セー ジ 転 送 性 能 48 ビ ッ ト の 読み 取り コマ ンド 
や 読み 取り 応答 メッ セー ジ の 転送 )) お よび ファ ブリ ッ 
ク に 固有 の 32ns の レイ テン シ ( 経路 設定 時 間 な ど ) の 上 


k 非 同期 及 E が 科 人 寄 宴 
加 治療 法 
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限 値 を 規定 する . 

e ネ ットワーク ・ ト ポロ ジーー 二 つの プロ セッ サ が 一 般 
的 な 状況 に お いて ) 同時 に イネ ー ブ ル され る こと は な く , 
メモ リ ・ シ ステ ム の パイ プラ イン 処理 に も 対応 し て いな 
い の で , それ ら の 同時 並行 動作 が 要求 され る こと は ほ と 
ん ど な い . その た め , 共有 バス に 似 た シン プル な 集中 ・ 
分 散 型 の ト ポロ ジ で 十分 だ っ た. 
この ファ ブリ ッ ク は , コマ ンド を 送る 二 つ の 送信 リン ク , 

応答 を 返す 二 つ の 受信 リン ク , そし て , 図 6 の よう な スイ 

ッ チ 部 品 か ら 構成 され て いま す . 


⑯ タイ ミン グ 検 証 の 作業 が 簡素 化 さ れる 

チッ プ の 最終 的 な レイ アウ ト を 図 7 に 示し ます . CHAIN 
リン ク と ファ ブリ ッ ク ・ ス イッ チ の 場所 も いっ し ょ に 示し 
ます . LSI の フロ アプ ラン に 関す る 制約 は , 各 リ ンク 長 を 
2mm 未 満 こ し, か つ , だ いた いそ の 長 さ を そろ える と い 
う も の で し た . これ は 難し い 制 約 で は あり ませ ん で し た . 
機能 の 妥当 性 の 検証 , お よび 演算 ブロ ッ ク の タイ ミン グ 
動作 の 確認 ・ 修 正 を 行う こと を 目的 に , チッ プ 全 体 の シミ 
ュ レ ーション を 行い まし た . この シミ ュ レ ーション で は , 
レイ アツ ウト 情報 か ら ( 寄生 容量 / 抵 抗 抽出 ツー ル で ) 抽出 し 


図 7 スマ ー ト ・ カ ー ド 用 LS「 Buxton」 


英国 University of Manchester が 開発 し た 試作 チッ プ . 
TSMC の 180nm の CMOS プロ セス で 製造 され た . 


プロ セッ サ 0 


プロ セッ サ 1 一 ヶ , 
図 6 


ネッ トワ ー ク ・ フ ァ ブ リッ ク の 構成 
スイ ッ チ 部 品 の 構成 を 示し て いる . 


テス ト ・ 凶 
イン ター フェ ー ス 較 ~ 


た 二 つ の プロ セッ サ の ト ラン ジス タ ・ レ ベル の ネッ トリ ス 
ト ( AC モ デル ), メモ リ の 機能 モデ ル , CHAIN ネットワ 
ー ク の トラ ンジ スタ ・ レ ベル の ネッ トリ スト ( ツー ル で 抽 
出し た も の で は な い ) を 使用 し まし た . 

チッ プ を 製造 する 前 に , CHAIN ネ ットワーク ・ フ ァ ブ 
リッ ク の 寄生 容量 / 抵 抗 の 抽出 は 行い ませ ん で し た . と い 
う の は , セル フタ イム ド 手法 に よる 設計 で は ( 随時 , 修正 
を 加え る こと で ) 適切 な が タ イミ ング 動作 が 保証 され て お り , 
加え て , この オン チッ プ ・ ネ ットワーク に は 要求 され る シ 
ステ ム 性 能 に 対し て か な り の マー ジン を 持た せ て あっ た た 
めで す . 

先 に 述べ た よう に , CHAIN ネ ットワーク で は , リン ク 
長 や リン ク 数 を 自由 に 選択 で きま す . つま り , 要求 され る 
ネッ トワ ー ク 性 能 に 合わ せ て リン ク の 構成 を きめ 細か く 指 
定 で きる の で す . また , マー ジン を 確保 し や すい CHAIN 
ネッ トワ ー ク を 中 核 と し て シス テム LSI を 構築 すれ ば , シ 
ステ ム ・ レ ベル の 接続 グロ ー バ ル 配 線 な ど ) の タイ ミン グ 
検証 の 作業 を か な り 簡素 化 で きま す . 

高 性 能 な シス テム LSI を 開発 する 場合 , 一 般 に , 機能 は 
適切 に 設計 され る の で す が , これ と は 別に , オン チッ プ ・ 
ネッ トワ ー ク の 性 能 を 確認 する た め に , な ん ら か の シミ ュ 
レー ショ ン を 行う こと が 望ま し いで し ょ う . 

オン チッ プ ・ ネ ットワーク の 設計 と この 試作 チッ プ に 
BE ER 
以外 の 工 生 ゲー ト ・ レ ベル ・ シ ミュ レー ショ ン , 静 的 
タイ ミン グ 解 析 , レイ アウ ト , 寄生 容量 / 抵 抗 抽出 , トラ 
ンジ スタ ・ レ ベル ・ シ ミュ レー ショ ン な ど ) で は , 米国 
Synopsys 社 や 米国 Cadence Design Systems 社 の ツー ル 


その ほか の 凶 
ペリ フェ ラル 
| 1 UART 


フラ ッシュ ・ ル 
メモ リ 0 


フラ ッシュ ・ 
0 メモ リ 1 
RAM 


ー テ ネットワーク ・ デ バッ グ ・ ポ ー ト 較 
arb: アー ビタ 区 
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を 使用 し まし た . セル ・ ラ イブ ラリ に は , 標準 的 な セル の 
ほか , 少数 の セル フタ イム ド 手法 専用 の セル (ミュー テッ 
クズ 7, Muller C と エレメント ( 9 な ど ) が 組み 込ま れ て いま 
す . これ ら の 専用 セル は , 従来 の 同期 設計 用 の 標準 セル を 
組み 合わ せ て 構成 する こと も で きる の で す が , 今回 は 性 能 
や 面積 を 最適 化す る た め に , カス タム 設計 を 行い まし た . 


⑱ オン チッ プ ・ ネ ットワーク は 500MHz 以上 で 動作 

ネッ トワ ー ク の 中 の ゲー ト ウェ イ ( ター ゲッ ト ) の 一 つ に 
は , デバ ッ グ し た り , ネッ トワ ー ク 性 能 を 測定 し た りす る 
た め の 回 路 を 追加 し まし た . この チッ プ の デバ ッ グ お よび 
CHAIN ネ ットワーク の 機能 の 詳細 に つい て は , 参考 文献 
(5) を 参照 し て くだ さい . 

測定 の 結果 , CHAIN フ ァ ブ リッ ク が 実際 に 500MHz 以 
上 の サイ クル ・ レ ー ト で 動作 する こと が 確認 され まし た. 
これ は , 図 4 に 示し た よう に , シミ ュ レ ーション で 予測 さ 
れ て いた と お り の 性 能 で ぶす チッ プ 上 の も っ と も 長い リン 
ク は 約 1.5mm). 先 に 述べ た よう に , すべ て の リン ク に 
いて ド ライ バ の 駆動 能力 が 不足 する 状況 に 章 遇 し まし た . 

これ に つい て は , 適切 が バッ ファ の 挿入 を 行え ば , さら に 

東 に 動作 する は ず で す . 

試作 チッ プ の 消費 電力 は 測定 し ませ ん で し た . これ は 
比較 対象 と な る 等 価 な 同期 設計 の LSI が 存在 し な か っ た た 
めで す . また , 電力 消費 は 回 路 の 動作 に も 左右 され ます が , 
シス テム ・ ソ フト ウェ ア の 影響 も 受け ます . 


⑱ オン チッ プ ・ ネ ットワーク 自動 生成 ツー ル を 開発 

ここ で 紹介 し た スマ ー ト ・ カード 用 LSI の オン チッ プ ・ 
ネッ トワ ー ク は , セル フタ イム ド 手法 の 専門 家 が 回 路 図 入 
力 に よっ て 設計 し まし た . また , アー キテ クチ ャ に つい て 
は , 限定 され た 範囲 で 複数 案 の 検討 を 行い まし た . 

た だ し , これ まで 同期 設計 を 行っ て きた LSI 設計 者 が 
CHAIN ネ ットワーク の 技術 を 商用 LSI の 開発 に 適用 し よ 
うと し た 場合 , 上 述 の よう な 手法 で 十分 と は 言え ませ ん . 
筆者 ら が 所 属す る Silistix 社 は , University of Manchester 
を 通じ て 融資 を 受け て いる ベン チャ 企業 で す . この 会 社 は , 
候補 と な る アー キテ クチ ャ の トレ ー ド オフ 評価 を 自動 化し , 
選択 され た オン チッ プ ・ ネ ットワーク を 自動 生成 コン パ 
イル ) する た め の ソ フト ウェ ア ・ ツ ー ル 「 CHAINworks」 と 
ライ ブラ リ の 開発 を 行っ て いま す . 

筆者 ら の 開発 し た ツー ル を 利用 する と , これ まで 同期 設 
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計 を 行っ て きた シス テム LSI の 開発 者 で も ( 例え ば , 非 同 
期 設 計 の 複雑 な ノウ ハウ を 理解 し て いな く て も ), ネッ ト 
ワー ク 接続 の 利点 と セル フタ イム ド 手法 の 利点 を 比較 的 容 

易 に 享受 する こと が で きま す . 以下 で は , 本 ツー ル の 構成 
に つい て 簡単 に 述べ ます . 
1 大 力 デー タ 

本 ツー ル の 入力 は , オン チッ プ ・ ネ ットワーク の ポー ト の 
SystemVerilog 構造 記述 ネッ トリ スト ), ある い は ブロ ッ 
ク 図 デー タ ( 例え ば , 米国 Mentor Graphics 社 の Design 
Architect」 や Cadence 社 の Composer」 で 作成 し た も の ) 
で す . これ ら の デー タ の 中 の バス ・ モ ジュ ー ル は , クラ イ 
アン ト ( IP コア ) に つなが る ポー ト を 含ん で いま す . それ 
ぞ れ の ポー ト に は アダ プ タ ・ ユ ニッ ト の 回 路 が 用 意 さ れ て 
お り , 業界 標準 の バス ・ イ ンタ ー フ ェ ー ス ( AMBA な ど ) 
を 利用 し て 回 路 ブ ロッ ク を 接続 し た い 場 合 に は この アダ プ 
タ ・ ユ ニッ ト を 使用 し ます . 

オン チッ プ ・ ネ ットワーク の 接続 要 促 例え ば , 異な る 
クラ イア ント の 間 の 伝送 性 能 や クラ イア ント の トラ フィ ッ 
ク * プロ ファ アイ ル 。 イ シン ター フェ エー ス の デー タ *・ パス 旧 , 
クラ イア ント の クロ ッ ク 周 波数 な ど ) が 明確 に な る よう に , 
ネッ トワ ー ク ・ モ ジュ ー ル と アダ プ タ に は いく つか の 制約 
が 設け られ て いま す . 
2) アー キテ クチ ャ の 評価 

本 ツー ル で は , ユー ザ が 与え る イン ター フェ ー ス 要求 や 
接続 上 の 制約 に 基づい て , さま ざま な アー キテ クチ ャ の ト 
レー ド オフ 評価 を 対話 的 に 行え ます . 例え ば , ト ポロ ジ や 
パイ プラ イン の 深 さ , リン ク 幅 を 変更 し な が ら , オン チッ 
プ ・ ネ ットワーク の 占有 面積 や 消費 電力 , 性 能 , 検証 に 要 
する 期間 な ど を 比較 ・ 検討 ほす. また , トラ フィ ッ ク が 
パタ ー ン 化 さ れ た ビヘイビア ・ バ ス ・ モ デル に よる シミ ュ 
レー ショ ン を 行い , その 結果 を トレ ー ド オフ 評価 の 工程 に 
反映 させ ます . こう し た 作業 は , 設計 の 最初 の 段階 で 行え 
ます . その た め , 後 工程 に お ける タイ ミン グ に 関す る 設計 
修正 の 回 数 が 減り , 全体 の 設計 効率 が 上 が り ま す . 
3) 設計 フロ ー と 出力 結果 

本 ツー ル は , 既存 の 設計 フロ ー に その まま 組み 込む こ 
が で きま す . 設計 フロ ー の 中 の 本 ツー ル の 位置 づけ を 図 8 
に 示し ます . この 図 は , ほか の ツー ル と の 関係 や タイ ミ > 
グ 収 束 の ル ー プ と の 関係 も 示し て いま す . 

本 ツー ル の 入力 デー タ は , 現状 で は , 制約 コメ ント 付き 
の SystemVerilog 構造 記述 で す . 一 方 , 出力 デー タ は 
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設計 入力 図 


SystemVerilog 記 述 図 


CHAINworks 導 


Verilog HDL 較 図 

ネッ トリ スト 図 コ 同 

論理 合成 Design Compiler) 較 NN 
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図 8 設計 フロ ー の 中 の CHAINworks の 位置 づけ 
CHAINworks は , 既存 の 設計 フロ ー に その まま 組み 込む こと が で きる . 


オン チッ プ ・ ネ ットワーク の Verilog HDL ネッ トリ スト 
( Verilog 95 に 準拠 )) お よび さま ざま な 工程 で 利用 され る 
補助 デー タ で す . 例え ば , 以下 の デー タ が 出力 され ます . 
@e シ ステ ム ・ レ ベル ・ シ ミュ レー ショ ン に 利用 され る 
Verilog HDL と SystemC こ の ビヘイビア ・ モ デル 
ネットワーク 部 品 の 配置 配線 や タイ ミン グ 解 析 に 利用 さ 
れる タイ ミン グ 制 約 デ ー タ ( SDF フ ォ ー マ ッ ト ) 
eLSI テ スト に 使用 され る オン チッ プ ・ ネ ットワーク の テ 
ト 由 パタ ーー 
4) ツー ル の 内 部 処理 
本 ツー ル は , 三 つ の 主要 な コン ポー ネン ト 「 Jacquard], 
「 Fitter」,「 Handloom] ii れ て いま 図 8 の 右側 
を 参照 )、 本 ツー ル の 合成 機能 は , 小 規 模 な ハー ドウ ェ ア ・ 
テン プレ ー ト 0 大 規模 な モジ ュー ル を 構築 
( コン パイ ル ) し ます . ライ ブラ リ に は , 基本 的 な 回 路 素子 , 
の トク ラガ イツ デー シス ツウ 天 シリ テラ オイ サ か ら ※ ポ 
ドジ ー ク ・ ダー トド 恨 よ エイ まで 、 多様 が テン プレ ー ド が 格 
納 さ れ て いま す . また , これ ら の 部 品 は , すべ て セル フタ 
イム ド 手法 に 基づい て 設計 され て お り , デー タ 幅 や 符号 化 
方 式 , 動作 速度 な が ど を パラ メー タ で 指定 で きる よう に な っ 
て いま す . 
使用 する 部 品 の 選定 と これ ら の 接続 は Fitter が 実行 し ま 
す . 制約 に 関係 する 部 分 に つい て は , Jacquard を 利用 し て 


顧客 の RTL 記 述 / 図 
ネッ トリ スト 罰 


タイ ミン グ 情 報 図 


コメ ント 付き の SystemVerilog 記 述 図 
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ユー ザ が 手 を 加え られ ます . 満足 の いく 設計 が 得 ら れ た ら 
バッ クエ ンド の Handloom が テク ノロ ジ ・ マッ の 8 
最終 的 な 構造 記述 ネッ トリ スト ) を 生成 し ます . 


参考 ・ 引 用 * 文献 

( 1) ARM : 47p4, 4Z47ce の 477c7oco77 が の //e7 Py 47C/77ec777e 
Spec が cg7 が oz, ey 2.0, May 1999. 

(2) IBM: CoreCozzec7 gs 47c777ec77e, p7ogdc7 の re, http:// 
www.chips.ibm.com/news/ 1999/990923/pdf/corecon128_pb.pdf 

( 3) L.A. Plana, P. A. Riocreux, W.J. Bainbridge, A. Bardsley, 
S. Temple, J. D. Garside and Z.C.Yu: “ SPA - a Secure 
Amulet Core for Smartcard Applications”, /77c7oprocessO7s の 
77c7osys7e775, DD. 431-446, vol. 27, no.9, Oct. 2003. 

( 2) W.J. Bainbridge and S.Furber: “ Chain: a Delay-Insensitive 

Chip Area Interconnect”, 7p 77c7o, DDp. 16-23, vol. 22, no5, 

Sep./Oct. 2002. 

( 5) W.J Bainbridge, L.A. Plana and S. B. Furber : The Design 

amd Test of a Smartcard Chip using a CHAIN selftimed net- 

work-on-chip, Pyoc. の 470% Prs), pp.274, vol. 3, Feb. 2004. 

(6) M. Shams, J. C. Ebergen and M.I. Elmasry : “" Modeliing 
and comparing CMOS implementations of the C-element", 
777 77o7ygc7 が oy o7 PV た 57 Sys7e7y。 DD. 563-567, vol 6, no. 4 
Dec. 1998. 

(の ⑦ CL Seitz,“ System timmg” in CA.Mead and L.A. Conway : 
7 が oc7o7 7 の VS7 Sys7e77s, Chapter 7, Addison-Wesley, 1980. 


W.」. Bainbridge, A. Bardsley, R. W. McGuffin 
英国 Silistix 社 


Design Wave Magozine 2005July 91 


